邊緣數據中心——位于他們所服務的客戶附近的小型關鍵任務設施,連接到一個更大的中央數據中心或多個數據中心——隨著組織尋求高性能和經濟高效的方法來減少延遲,正在越來越多地被使用。邊緣數據中心已成為隨時隨地提供對當今最終用戶所需的應用程序、服務和數據的訪問的關鍵。隨著大數據、物聯網 (IoT)、云和流媒體服務以及其他技術趨勢,延遲不再是可以容忍的。
由于邊緣的性質,數據中心經理經常難以管理其邊緣基礎設施。邊緣基礎設施管理的一些挑戰包括管理許多遠程站點的復雜性、缺乏現場人員、跟蹤設備和配置、站點基礎設施監控、站點和設備安全以及設備維護。幸運的是,使用正確的遠程管理工具,您可以減少延遲、保持可用性和正常運行時間,并在降低成本的同時實現最佳性能。
邊緣基礎設施管理的 5 個最佳實踐
1. 監控電源和環境趨勢
您應該利用企業輪詢引擎從您的邊緣站點收集所有電力和環境數據,長期保留這些數據,并將其轉化為易于使用、靈活的圖表功能形式的可操作信息,例如隨著時間的推移跟蹤您所在位置的有功功率。
Akamai 的 Michael Garito 分享了一個示例,說明趨勢功率數據對他的價值。他們的大部分設備都是由內部硬件團隊定制的,他們執行廣泛的基準測試以確定其在生產中的表現。當他們部署數據中心基礎設施管理 (DCIM) 軟件時,Garito 說,“令人大開眼界的是,在一天的過程中發現,盡管我們有我們認為會使用的數字,但現實與我們的計劃并沒有非常一致。
“特別是在一個數據中心,一天中我們的電力需求從低使用期到高使用期的波動幅度可能高達 200 千瓦,”Garito 繼續說道。“能夠看到這種波動并使用這些信息來防止潛在的問題,例如斷路器跳閘,以及確定我們超出預算的區域,這樣我們就可以開始在適用的地方進行回填,這是非常有價值的信息,我們期待將其推出到更多地點。”
Garito 還監控和趨勢溫度數據,以減少 Akamai 的環境足跡和能源成本。
“隨著時間的推移,能夠監測內部溫度使我們能夠更好地決定何時吸入外部空氣與再循環內部空氣,”Garito 說。“所有這些數據隨時可用并能夠在一段時間內對其進行跟蹤,這使我們不僅可以規劃日常運營,還可以開始進行長期規劃,這樣我們就可以開始規劃整個季節并相應地分配資源。”
2. 監控電力負載
在邊緣部署設備成本高昂,您希望在從第三方租用的空間中放置盡可能多的設備。因此,監控電源負載不僅對于了解功耗的總體趨勢很重要,而且對于了解您需要為部署的每個計算設備預算的確切負載也很重要。
Comcast 利用第二代 DCIM中的自動功率預算功能,為部署的每個計算設備收集大量數據,并使用用戶可配置的策略,計算出部署每個品牌/型號實例時使用的高度準確的預算值。每個實例都有自己的預算,允許您在租用的給定空間中部署更多的計算容量。
Comcast 的邁克爾·皮爾斯 (Michael Piers) 說:“這是我們可以利用的一項重要功能。” “過去,我們所做的是一個非常手動的過程,我們會查看每個電源的銘牌并取一些任意數字,比如 60%...我們使用這個工具發現并實際得到的東西從 Power IQ 到 dcTrack 的實時數據是我們有一些設備,而不是我們使用的這 60%,可能只使用了 38%……而且我們能夠在其中放置更多的設備空間。當您已經為它付費時,利用這種擱淺的力量是非常巨大的。對我們來說,這是使用該工具的真正巨大好處。”
3. 監控邊緣站點的健康狀況
邊緣數據中心是關鍵任務,您需要監控它們的健康狀況以確保服務繼續運行。您需要一個整體視圖——例如一個企業健康儀表板,它在一個單一的管理面板中顯示所有邊緣站點的實時電源和環境健康狀況以及事件——并且能夠向下鉆取細粒度的機柜級指標。在這樣的儀表板中,易于理解的紅色/綠色/黃色顏色編碼指示您的站點在可能成為問題的潛在事件或容量限制方面的狀態,例如關鍵事件、最熱的機架、最近添加的數量和傭金和當前的電力負荷。
“瓷磚的簡單顏色編碼是我最喜歡的功能之一,因為紅色不好,綠色很好,黃色表示通常可以等到午餐后,”Akamai 的 Garito 說。
“我們最近有一個機架因功率為 9.3kw 而發出警報,而它是一個 17kw 的機架,”Garito 繼續說道。“問題是有兩個 PDU,每個 9.6 千瓦,功率綽綽有余。問題是現場團隊沒有正確地平衡兩個機架 PDU 之間的服務器負載。這種事情通過 QA 就可以了,因為當它通過 QA 時,它沒有足夠的功率來觸發警報,但是一旦它投入生產并實際獲得該流量負載,這些警報就會出現。能夠快速識別問題并快速區分一個 PDU 與另一個 PDU 上的所有負載,這些都是在問題升級之前實現快速響應的類型。”
4. 監控電源和冷卻能力
增加功率容量或冷卻容量通常有提前期,因此您需要準確了解您當前的容量是多少以及何時會用完。利用具有零配置儀表板小部件的DCIM 解決方案,例如按站點劃分的容量計,以準確查看您所在的位置。使用您自己的紅色/黃色/綠色閾值配置您的儀表,以輕松查看您是否在每個站點都有容量、是否需要額外容量,或者是否在任何地方都用完了容量。
“計劃何時需要增加電力或需要增加冷卻,以及兩者之間的相關性——1 瓦為 3.41 BTU——是我們關注并能夠理解和更好地利用我們的空間和電力,并更有效地利用的東西這些美妙的資產,”皮爾斯說。“這個工具絕對可以幫助我們了解我們所處的位置和我們要去的地方。”
5. 跟蹤所有站點的所有資產
大多數擁有邊緣站點的組織都有涉及多個位置和業務應用程序的復雜部署。維護每個站點所有設備的準確清單需要實時查看機柜內容、基礎設施設備和布線。使用 DCIM 軟件,您可以從不同的位置并排查看多個機柜,并查看機柜中物品的高保真正面和背面圖像。在基于角色的訪問控制方面,可以與同事共享自動繪制的機架立面圖,以便他們看到與您相同的視圖。
“在開始使用 DCIM 之前,一切都會進入數據庫。但是,關于數據庫的事情是數據庫主要由人組成,這往往是跟蹤這些事情的薄弱環節。擁有數十萬個資產,需要跟蹤很多東西,”Garito 說。“除此之外,我們的許多項目都跨越多個機架,因此您可能在相鄰機架或一兩排設備中有一組設備,這些集群可能會反饋到另一個機架中的聚合層。能夠快速、直觀地展示這些信息可以顯著改善規劃和故障排除。”
獎勵:遠程可視化您的邊緣站點
現代邊緣基礎設施管理軟件將提供比現場更好的遠程可視化。您可以查看任何站點并獲得真實的平面圖視圖,就像您身臨其境一樣,但也可以引入各種信息,例如可用 RU、前端溫度和測得的電流,以快速查看站點的健康狀況以及您可以在何處部署設備。您還可以隔離一行并疊加數據,例如實際電力負載、預算負載和環境傳感器數據。您甚至可以查看櫥柜上方和地板下方。
通過遠程可視化,您還可以通過顏色編碼將數據轉化為易于理解的信息。例如,按任何資產屬性(例如客戶)對您的機柜和內容進行顏色編碼,并查看誰擁有哪些機柜和哪些設備。了解您擁有什么、誰擁有它以及設備上的 SLA 是有效管理邊緣站點的關鍵。
“對于故障排除,能夠在視覺上快速識別所有內容通常是關鍵,”Garito 說。“因為我們有這么多不同的設備、不同的服務器型號、服務器型號的不同變體,我們跟蹤所有這些信息,能夠快速識別——不僅僅是準備一個列表——而是識別特定型號的所有服務器在空間中的位置被認為有缺陷的零件……并在問題發生之前將它們停產。”
匯集一切
由于缺乏現場人員并且無法了解正在發生的事情,邊緣基礎設施管理可能是一個挑戰,但是使用 DCIM 軟件,您可以簡化邊緣基礎設施管理并提高正常運行時間、效率和生產力。無論您是剛剛了解 DCIM 軟件還是已經是資深用戶,這些來自業界最佳邊緣數據中心專業人士的最佳實踐和技巧都可以幫助您克服管理邊緣站點的挑戰。當您的新知識與 DCIM 軟件結合使用時,將推動更智能、更有效的邊緣基礎設施管理。